註:本文同步更新在Notion!(數學公式會比較好閱讀)
侷限型波茲曼機(Restricted Boltzmann Machines, RBM)是一種基於隱馬爾可夫模型和概率圖的生成模型,主要用於無監督學習,特別是在深度學習中的應用,如深度信念網路(Deep Belief Networks, DBN)。RBM 通過捕捉數據中的隱藏模式來學習數據的分佈,並且常被用來進行特徵提取、降維和生成數據。
本篇文章將從數學角度探索 RBM 的結構、運算過程以及在深度學習中的應用。
RBM 是一種雙層的概率圖模型,包括可見層 (visible layer) 和隱藏層 (hidden layer)。這兩層之間的節點是全連接的,但層內的節點之間是非連接的,這就是“侷限型”名稱的由來。每個節點都代表一個二進制狀態(0 或 1)。
RBM 的核心目標是學習數據的概率分佈,並通過隱藏層來生成與原始數據相似的樣本。
RBM 的目標是學習輸入數據的機率分佈。每一個可見單元和隱藏單元的激活依賴於對應層中的節點狀態及其與另一層的連接權重。
為了訓練 RBM,通常會使用對比散度(Contrastive Divergence, CD) 算法。這個算法用來逼近最大似然估計的梯度,並有效地更新權重。基本流程如下:
RBM 的數學優勢在於其能夠有效地對高維數據進行建模,並且能夠以概率的方式來表示輸入數據的分佈。通過對比散度算法,RBM 能夠在大規模數據集上進行高效的訓練,這為深度學習的發展奠定了基礎。
侷限型波茲曼機是一個強大的工具,用於無監督學習中的特徵提取和數據生成。儘管其訓練過程具有挑戰性,但通過對比散度算法和概率圖模型,RBM 能夠有效地捕捉數據中的隱藏模式,並且在深度學習中的許多領域展現出了潛力。